Entrepôts de données multidimensionnelles NoSQL

نویسندگان

  • Max Chevalier
  • Mohammed El Malki
  • Arlind Kopliku
  • Olivier Teste
  • Ronan Tournier
چکیده

Résumé. Les données des systèmes d’analyse en ligne (OLAP, On-Line Analytical Processing) sont traditionnellement gérées par des bases de données relationnelles. Malheureusement, il devient difficile de gérer des mégadonnées (de gros volumes de données, « Big Data »). Dans un tel contexte, comme alternative, les environnements « Not-Only SQL » (NoSQL) peuvent fournir un passage à l’échelle tout en gardant une certaine flexibilité pour un système OLAP. Nous définissons ainsi des règles pour convertir un schéma en étoile, ainsi que son optimisation, le treillis d’agrégats pré-calculés, en deux modèles logiques NoSQL : orienté-colonnes ou orienté-documents. En utilisant ces règles, nous implémentons et analysons deux systèmes décisionnels, un par modèle, avec MongoDB et HBase. Nous comparons ces derniers sur les phases de chargement des données (générées avec le benchmark TPC-DS), de calcul d’un treillis et d’interrogation.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Modélisation et interrogation de données XML multidimensionnelles

Résumé. XML étant devenu omniprésent et ses techniques de stockage et d’interrogation de plus en plus efficaces, le nombre de cas d’utilisations de ces technologies augmente tous les jours. Un sujet prometteur est l’intégration d’XML et des entrepôts de données, dans laquelle une base de données XML native stocke les données multidimensionnelles et exécute des requêtes OLAP écrites à l’aide du ...

متن کامل

Panorama de travaux autour de l'intégration de données spatio-temporelles dans les hypercubes

Résumé : Cet article présente un panorama des différents travaux qui sont effectués dans notre équipe autour de l’intégration des données spatiotemporelles dans les entrepôts de données et les hypercubes. Nous nous sommes plus particulièrement intéressés à la prise en compte des évolutions dans les dimensions spatiales, à la modélisation multidimensionnelle de données continues et à la concepti...

متن کامل

Modèle d’archivage d’entrepôts de données multidimensionnelles

Data warehouses are commonly used for decision making. Data integrated by these systems is, on the one hand, periodically updated and permanently stored on the other hand. When data is historized, decision-makers are usually less interested in old information, but still integrating it into their analysis. In this paper, we present a new mechanism for data archiving and summarizing across the ti...

متن کامل

Fouille de Données Multidimensionnelles : Différentes Stratégies pour Prendre en Compte la Mesure

Résumé. Les entrepôts de données contiennent de gros volumes de données historisées stockées à des fins d’analyse. Des techniques d’extraction de motifs séquentiels multidimensionnels ont été développées afin de mettre en exergue des corrélations entre des positions sur des dimensions au cours du temps. Même si ces méthodes offrent une meilleure appréhension des données sources en prenant en co...

متن کامل

Analyse multidimensionnelle de documents via des dimensions OLAP

RÉSUMÉ. Avec l’émergence de formats de données semi-structurés (tels que XML), le stockage de documents dans un entrepôt centralisé est apparu de façon naturelle comme une adaptation des entrepôts de données. De nos jours, les systèmes OLAP (On-Line Analytical Processing) font face à une part grandissante de données non numériques. Cet article présente un environnement pour l’analyse multidimen...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2015